AI资讯新闻榜单内容搜索-multi-toke

不改模型、不降质量，谷歌让Gemma 4快了3倍：本地跑大模型彻底变天

谷歌刚刚给Gemma 4家族更新了一项关键能力：Multi-Token Prediction（MTP）推测解码架构，推理速度最高提升3倍，输出质量不变。

来自主题: AI资讯

9367 点击 2026-05-06 14:56

阶跃星辰今日发布新一代自动语音识别模型StepAudio 2.5 ASR。该模型面向语音转写与长音频处理场景，在架构上引入Multi-Token Prediction（多Token预测）以提升推理效率，并通过扩展上下文窗口强化长内容识别能力。

来自主题: AI资讯

9574 点击 2026-04-25 10:22

彭超曾在华为印度、阿里任消费硬件业务1号位；联合创始人齐炜祯为Multi-token架构开创学者，被Deepseek、Qwen引入预训练方法。

来自主题: AI资讯

7433 点击 2025-10-28 10:43

告别Next-token，现在模型微调阶段就能直接多token预测！

来自主题: AI技术研报

9460 点击 2025-07-25 10:00

Attention 还在卷自己。

来自主题: AI技术研报

9135 点击 2025-04-05 14:17